Phân tích sem là gì? Các bài nghiên cứu khoa học liên quan

Phân tích SEM là phương pháp thống kê đa biến dùng để mô hình hóa và kiểm định các mối quan hệ nhân quả giữa biến quan sát và biến tiềm ẩn trong một khung thống nhất. Phương pháp này kết hợp hồi quy, phân tích nhân tố và phân tích đường dẫn, cho phép đánh giá đồng thời thang đo và mô hình lý thuyết dựa trên dữ liệu thực nghiệm.

Khái niệm phân tích SEM

Phân tích SEM (Structural Equation Modeling – mô hình phương trình cấu trúc) là một phương pháp thống kê đa biến được thiết kế để mô hình hóa, ước lượng và kiểm định các mối quan hệ phức tạp giữa nhiều biến cùng lúc. Điểm đặc trưng của SEM là khả năng xử lý đồng thời cả biến quan sát được trực tiếp và biến tiềm ẩn không thể đo lường trực tiếp, từ đó phản ánh các khái niệm trừu tượng trong nghiên cứu khoa học một cách có hệ thống.

Trong SEM, các mối quan hệ giữa biến không chỉ dừng ở tương quan mà còn được diễn giải theo hướng nhân quả dựa trên mô hình lý thuyết được xây dựng trước. Điều này giúp SEM vượt trội so với các kỹ thuật hồi quy truyền thống, vốn chỉ xem xét từng phương trình riêng lẻ và khó kiểm soát sai số đo lường.

Về mặt phương pháp luận, SEM được xem như một khung phân tích tổng hợp, kết hợp phân tích nhân tố xác nhận, phân tích đường dẫn và hồi quy đa biến. Nhờ đó, nhà nghiên cứu có thể đánh giá đồng thời độ tin cậy của thang đo và mức độ phù hợp của các giả thuyết lý thuyết với dữ liệu thực nghiệm.

  • Mô hình hóa quan hệ giữa nhiều biến phụ thuộc và độc lập
  • Xử lý biến tiềm ẩn và sai số đo lường
  • Kiểm định mô hình lý thuyết tổng thể

Nguồn gốc và sự phát triển của SEM

Nguồn gốc của SEM bắt đầu từ phân tích đường dẫn (path analysis) do Sewall Wright đề xuất vào những năm 1920, nhằm mô tả các quan hệ nhân quả giữa các biến quan sát. Sau đó, các kỹ thuật phân tích nhân tố được phát triển để xử lý các khái niệm không đo lường trực tiếp, đặt nền móng cho việc hình thành các mô hình biến tiềm ẩn.

Đến thập niên 1960–1970, với sự ra đời của mô hình LISREL (Linear Structural Relations), SEM chính thức được định hình như một phương pháp thống kê hoàn chỉnh. Việc kết hợp mô hình đo lường và mô hình cấu trúc trong cùng một khuôn khổ đã mở rộng đáng kể khả năng phân tích dữ liệu trong khoa học xã hội và hành vi.

Sự phát triển của máy tính và thuật toán tối ưu số đã thúc đẩy SEM trở nên phổ biến hơn trong nghiên cứu ứng dụng. Ngày nay, SEM được triển khai rộng rãi thông qua các phần mềm chuyên dụng như LISREL, AMOS, Mplus và SmartPLS, cho phép xử lý các mô hình lớn với cấu trúc phức tạp (Mplus).

Giai đoạn Đóng góp chính
1920–1950 Phân tích đường dẫn và hồi quy
1960–1980 Hình thành SEM và LISREL
Sau 1990 Phần mềm SEM và ứng dụng rộng rãi

Các thành phần cơ bản của mô hình SEM

Một mô hình SEM hoàn chỉnh bao gồm hai cấu phần chính: mô hình đo lường (measurement model) và mô hình cấu trúc (structural model). Mô hình đo lường mô tả mối quan hệ giữa biến tiềm ẩn và các biến quan sát, phản ánh cách các chỉ báo đo lường đại diện cho khái niệm lý thuyết.

Mô hình cấu trúc tập trung vào các mối quan hệ nhân quả giữa các biến tiềm ẩn, thể hiện các giả thuyết nghiên cứu cốt lõi. Việc tách biệt rõ hai mô hình này giúp nhà nghiên cứu đánh giá độc lập chất lượng thang đo và cấu trúc lý thuyết, đồng thời hạn chế sai lệch trong suy luận.

Ngoài ra, SEM còn bao gồm các thành phần như sai số đo lường, sai số nhiễu và các tham số ước lượng. Việc mô hình hóa tường minh các sai số là ưu điểm quan trọng giúp SEM phản ánh dữ liệu thực tế chính xác hơn so với các phương pháp truyền thống.

  • Biến tiềm ẩn nội sinh và ngoại sinh
  • Biến quan sát (chỉ báo)
  • Sai số đo lường và sai số cấu trúc

Biến tiềm ẩn và biến quan sát trong SEM

Biến tiềm ẩn là các khái niệm trừu tượng không thể đo lường trực tiếp, chẳng hạn như sự hài lòng, thái độ, động lực hoặc chất lượng dịch vụ. Trong SEM, các biến này được suy diễn thông qua một tập hợp các biến quan sát, thường thu thập bằng bảng hỏi, thang đo Likert hoặc dữ liệu thực nghiệm.

Biến quan sát đóng vai trò là các chỉ báo cho biến tiềm ẩn, nhưng luôn chứa sai số đo lường. SEM cho phép ước lượng và tách riêng phần sai số này, từ đó cải thiện độ chính xác của các mối quan hệ được phân tích. Đây là điểm khác biệt căn bản giữa SEM và hồi quy đa biến, vốn giả định các biến được đo lường hoàn hảo.

Mối quan hệ giữa biến tiềm ẩn và biến quan sát thường được biểu diễn thông qua các hệ số tải nhân tố (factor loading). Các hệ số này phản ánh mức độ đóng góp của từng chỉ báo vào khái niệm lý thuyết và là căn cứ để đánh giá độ tin cậy và giá trị của thang đo.

Loại biến Đặc điểm Ví dụ
Biến tiềm ẩn Không đo trực tiếp Sự hài lòng
Biến quan sát Đo lường trực tiếp Câu hỏi khảo sát

Mô hình đo lường và phân tích nhân tố xác nhận

Mô hình đo lường là bước nền tảng trong phân tích SEM, tập trung đánh giá mức độ mà các biến quan sát phản ánh chính xác các biến tiềm ẩn. Thành phần cốt lõi của mô hình đo lường là phân tích nhân tố xác nhận (Confirmatory Factor Analysis – CFA), trong đó cấu trúc nhân tố được xác định trước dựa trên lý thuyết hoặc nghiên cứu trước đó, thay vì khám phá từ dữ liệu như phân tích nhân tố khám phá.

CFA cho phép kiểm định mức độ phù hợp giữa dữ liệu quan sát và mô hình đo lường giả thuyết. Các hệ số tải nhân tố (factor loading) phản ánh mức độ đóng góp của từng biến quan sát vào biến tiềm ẩn tương ứng, từ đó giúp loại bỏ các chỉ báo kém chất lượng và cải thiện độ tin cậy của thang đo.

Trong SEM, chất lượng mô hình đo lường thường được đánh giá thông qua các chỉ số như độ tin cậy tổng hợp (Composite Reliability – CR) và phương sai trích (Average Variance Extracted – AVE). Những chỉ số này giúp đảm bảo rằng các biến tiềm ẩn được đo lường một cách nhất quán và có giá trị hội tụ.

  • Hệ số tải nhân tố (Factor loading)
  • Độ tin cậy tổng hợp (CR)
  • Phương sai trích (AVE)

Mô hình cấu trúc và quan hệ nhân quả

Mô hình cấu trúc trong SEM mô tả các mối quan hệ nhân quả giả thuyết giữa các biến tiềm ẩn, phản ánh khung lý thuyết của nghiên cứu. Không giống hồi quy truyền thống, SEM cho phép ước lượng đồng thời nhiều mối quan hệ phụ thuộc, bao gồm cả tác động trực tiếp và gián tiếp giữa các biến.

Các mối quan hệ này thường được biểu diễn dưới dạng hệ phương trình tuyến tính, trong đó mỗi biến nội sinh có thể đồng thời đóng vai trò là biến phụ thuộc và biến độc lập. Cách tiếp cận này giúp mô hình hóa các cấu trúc lý thuyết phức tạp thường gặp trong khoa học xã hội và hành vi.

Một biểu diễn tổng quát của mô hình cấu trúc có thể viết như sau:

η=Bη+Γξ+ζ \eta = B\eta + \Gamma\xi + \zeta

Trong đó, η\eta là tập biến tiềm ẩn nội sinh, ξ\xi là tập biến tiềm ẩn ngoại sinh, còn ζ\zeta biểu diễn sai số cấu trúc.

Các chỉ số đánh giá độ phù hợp của mô hình SEM

Độ phù hợp của mô hình SEM phản ánh mức độ mà mô hình lý thuyết tái tạo được ma trận hiệp phương sai của dữ liệu quan sát. Việc đánh giá không dựa trên một chỉ số đơn lẻ mà cần xem xét đồng thời nhiều chỉ số với ý nghĩa thống kê và thực nghiệm khác nhau.

Các chỉ số phổ biến bao gồm nhóm chỉ số tuyệt đối, chỉ số gia tăng và chỉ số sai số xấp xỉ. Mỗi nhóm cung cấp một góc nhìn khác nhau về chất lượng mô hình, giúp nhà nghiên cứu đưa ra đánh giá cân bằng.

Chỉ số Ý nghĩa Ngưỡng tham khảo
CFI / TLI So sánh mô hình với mô hình độc lập > 0.90
RMSEA Sai số xấp xỉ của mô hình < 0.08
SRMR Sai khác chuẩn hóa < 0.08

Ứng dụng của phân tích SEM trong nghiên cứu khoa học

SEM được ứng dụng rộng rãi trong khoa học xã hội, tâm lý học, giáo dục và quản trị, nơi các khái niệm nghiên cứu thường mang tính trừu tượng và khó đo lường trực tiếp. Phương pháp này cho phép kiểm định các mô hình lý thuyết phức tạp với nhiều biến trung gian và biến điều tiết.

Trong nghiên cứu hành vi người tiêu dùng, SEM thường được sử dụng để phân tích mối quan hệ giữa chất lượng dịch vụ, sự hài lòng, niềm tin và lòng trung thành. Việc mô hình hóa đồng thời các yếu tố này giúp cung cấp bằng chứng thực nghiệm vững chắc cho các lý thuyết marketing và quản trị.

Trong giáo dục và y tế, SEM hỗ trợ đánh giá các mô hình tác động của môi trường, chính sách hoặc can thiệp lên kết quả học tập và sức khỏe, với khả năng kiểm soát sai số đo lường tốt hơn so với các phương pháp truyền thống.

Hạn chế và lưu ý khi sử dụng SEM

Mặc dù có nhiều ưu điểm, SEM cũng tồn tại các hạn chế đáng lưu ý. Phương pháp này đòi hỏi cỡ mẫu đủ lớn để đảm bảo độ ổn định của ước lượng, đặc biệt khi mô hình có nhiều biến tiềm ẩn và tham số cần ước lượng. Cỡ mẫu không phù hợp có thể dẫn đến kết quả sai lệch hoặc không hội tụ.

SEM dựa mạnh vào giả định về phân phối dữ liệu, thường là phân phối chuẩn đa biến. Khi các giả định này bị vi phạm, nhà nghiên cứu cần sử dụng các phương pháp ước lượng thay thế hoặc SEM dựa trên phương sai (PLS-SEM) để đảm bảo độ tin cậy của kết quả.

Một vấn đề quan trọng khác là nguy cơ điều chỉnh mô hình quá mức theo dữ liệu (overfitting). Việc thay đổi mô hình chỉ để cải thiện chỉ số phù hợp mà thiếu cơ sở lý thuyết có thể làm giảm giá trị khoa học và khả năng khái quát hóa của nghiên cứu.

Xu hướng phát triển của SEM trong nghiên cứu hiện đại

Xu hướng hiện nay của SEM hướng tới việc tích hợp với các phương pháp phân tích dữ liệu lớn và học máy, cho phép xử lý các mô hình phức tạp hơn với dữ liệu đa nguồn. Các phiên bản SEM động và SEM đa cấp đang được phát triển nhằm phân tích dữ liệu theo thời gian và dữ liệu phân cấp.

Bên cạnh đó, PLS-SEM ngày càng được sử dụng trong các nghiên cứu khám phá và dự đoán, đặc biệt khi dữ liệu không đáp ứng các giả định nghiêm ngặt của SEM hiệp phương sai. Sự đa dạng về phương pháp giúp SEM tiếp tục giữ vai trò quan trọng trong phân tích định lượng hiện đại.

Trong tương lai, SEM được kỳ vọng sẽ tiếp tục mở rộng sang các lĩnh vực liên ngành, kết hợp chặt chẽ giữa lý thuyết, thống kê và khoa học dữ liệu để giải thích các hiện tượng phức tạp trong khoa học và xã hội.

Tài liệu tham khảo

  • Kline, R. B. (2016). Principles and Practice of Structural Equation Modeling. Guilford Press.
  • Hair, J. F., Hult, G. T. M., Ringle, C. M., & Sarstedt, M. (2019). A Primer on Partial Least Squares Structural Equation Modeling (PLS-SEM). Sage.
  • Bollen, K. A. (1989). Structural Equations with Latent Variables. Wiley.
  • Statistical Innovations. Structural Equation Modeling Overview. https://www.statisticalinnovations.com/
  • Mplus User’s Guide. Structural Equation Modeling. https://www.statmodel.com/

Các bài báo, nghiên cứu, công bố khoa học về chủ đề phân tích sem:

NGHIÊN CỨU ĐẶC ĐIỂM TỔNG PHÂN TÍCH TẾ BÀO MÁU NGOẠI VI VÀ ĐIỆN DI HEMOGLOBIN CÁC THỂ BETA-THALASSEMIA TẠI BỆNH VIỆN HUYẾT HỌC - TRUYỀN MÁU CẦN THƠ NĂM 2021-2022
Tạp chí Y Dược học Cần Thơ - Số 62 - Trang 172-179 - 2023
#Beta-thalassemia #tổng phân tích tế bào máu ngoại vi #điện di hemoglobin
Phương Pháp Kết Hợp dựa trên Mô Hình Học Sâu cho Phân Tích Tình Cảm trên Hình Ảnh
Journal of Technical Education Science - Tập 19 Số 2 - Trang 68-77 - 2024
#Image sentiment analysis #Ensemble model #VGG19-based CNN #ResNet50-based CNN #Convolutional neural network
SO SÁNH PHƯƠNG PHÁP PHÂN TÍCH CB-SEM VÀ PLS-SEM TRONG KIỂM ĐỊNH MÔ HÌNH ĐÁNH GIÁ HIỆU QUẢ CỦA HÌNH THỨC BỒI DƯỠNG GIÁO VIÊN TRỰC TUYẾN
Tạp chí Khoa học Trường Đại học Sư phạm Thành phố Hồ Chí Minh - Tập 19 Số 2 - Trang 213 - 2022
#mô hình phân tầng #bồi dưỡng chuyên môn #CB-SEM #PLS-SEM #mô hình cấu trúc tuyến tính #hiệu quả đào tạo
Phương Pháp Kết Hợp dựa trên Mô Hình Học Sâu cho Phân Tích Tình Cảm trên Hình Ảnh
Journal of Technical Education Science - Tập 19 Số 02 - Trang 68-77 - 2024
#Image sentiment analysis #Ensemble model #VGG19-based CNN #ResNet50-based CNN #Convolutional neural network
Một phương pháp bán giám sát trong mô hình hóa chủ đề văn bản ngắn sử dụng phân cụm mờ nhúng để đề xuất hashtag trên Twitter Dịch bởi AI
Discover Sustainability - Tập 5 Số 1
#mạng xã hội #hashtag #mô hình hóa chủ đề #phân cụm mờ #Word2Vec #phân tích tweet
MỘT TIẾP CẬN TÌM KIẾM ẢNH THEO NGỮ NGHĨA DỰA TRÊN MẠNG NƠ-RON TÍCH CHẬP VÀ ONTOLOGY
Tạp chí Khoa học Trường Đại học Sư phạm Thành phố Hồ Chí Minh - Tập 19 Số 3 - Trang 411 - 2022
#phân lớp ảnh #mạng nơ-ron tích chập #truy vấn ảnh dựa trên ngữ nghĩa #ontology
Tổng số: 130   
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 10